Direkt zum Inhalt
Bildverarbeitungsstation Bildverarbeitungsstation
Detailbeschreibung

Moderne Produktionssysteme setzen auf intelligente Vernetzung – ein komplexes System aus Maschinen und Prozessen, gesteuert und geregelt durch Informations- und Kommunikationstechnologien. Dieser digitale Wandel ist unerlässlich, um im dynamischen Wettbewerb bestehen zu können. Ein entscheidender Schritt hin zu noch effizienteren und präziseren Produktionsabläufen ist die Integration von KI-basierter Bildverarbeitung mit Objekterkennung.

Im Mittelpunkt steht hierbei der Einsatz des YOLO-Algorithmus. Ein leistungsstarkes Werkzeug zur schnellen und präzisen Objekterkennung in Echtzeit. Hierbei können die unterschiedlichsten Objekte wie z.B. nach Farbe, Größe oder nach bestimmten Fehlern, erkannt werden.
Neuartig ist zusätzlich die Erweiterung um die Grounding DINO Technologie, welche eine textbasierte Objekterkennung ermöglicht.Hierbei wird ein Name eines Objektes eingegeben. Das System findet dieses im Bild und filtert alles andere heraus.

Vorteile der Lösung
Ein KI-gestütztes Kamerasystem, basierend auf einer handelsüblichen Webcam, ermöglicht die schnelle und kostengünstige Erkennung von z.B. Objekten, Farben, Formen und Fehlern u.v.m. Somit sind Qualitätskontrollen und eine automatisierte Prozessüberwachung möglich, welche zeitgleich den manuellen Aufwand reduzieren, menschliche Fehler minimieren und die Effizienz steigern. Darüber hinaus erhöht es die Geschwindigkeit und Präzision durch eine schnelle Analyse großer Datenmengen und eine genaue Erkennung selbst kleinster Details. Ferner erlaubt es zerstörungsfreie Analysen, selbst aus sicherheitsrelevanten Entfernungen. So lassen sich zuverlässige Aussagen zur Qualität und zum Prozessstatus treffen.

Genutzte Technologien/Demonstrationsszenarien
Diese Demonstration zeigt die Echtzeit-Fähigkeiten der KI-basierten Objekterkennung. Ein kontinuierlicher Videostream von einer Webcam wird vom YOLO-Algorithmus analysiert, wobei erkannte Objekte sofort umrandet und im Bild angezeigt werden. Das System erkennt gleichzeitig verschiedene Objekte, unabhängig von ihrer Art oder Größe – von Fahrrädern und Autos bis hin zu Personen und Tastaturen. Eine zweite Möglichkeit besteht in der textbasierten Suche nach Objekten. Der Benutzer kann den Namen eines Objekts eingeben, und das System filtert den Videostream, um nur die entsprechenden Instanzen hervorzuheben. Beispielsweise könnten in einer Menschenmenge alle Personen mit Bart identifiziert und markiert werden, während alle anderen Objekte ausgeblendet bleiben. Diese Demonstration verdeutlicht die Leistungsfähigkeit und Vielseitigkeit der KI-basierten Objekterkennung in Echtzeit, sowohl für die simultane Erkennung mehrerer Objekte als auch für die gezielte Suche nach spezifischen Merkmalen. Die Kombination aus kontinuierlicher Videoanalyse und textbasierter Suche eröffnet neue Möglichkeiten für diverse Anwendungen

Einsatzgebiete/Branchen
Die im Demonstrationsszenarium vorgestellte Technologie eignet sich für Unternehmen, welche eine Prozessüberwachung oder Qualitätskontrolle innerhalb Ihrer Produktionskette durchführen wollen. Hierbei kann der Algorithmus eine Vielzahl an unterschiedlichen Merkmalen, Fehlerbildern oder Defekten erkennen, sofern diese im Vorfeld dafür trainiert wurden.